講義資料

メイン資料

今日の資料はコチラから.

スマホで見る方はQRコードを読み込んでください

講義資料

平均値・分散・標準偏差とは?

  • 平均値:全てのデータを足して割ったもの.一般的に代表値(データ全体を表している数値)として扱われる.
  • 分散:平均値とそれぞれの値の差を求めて2乗して,合計したものをデータの個数で割ったもの.データの散らばり具合を示す数値であり,分散が大きければ大きいほど,データが散らばっていることを示す.
    • \(\sigma^2\) という記号で表される.
    • \((分散)=\Sigma\{(データの値)-(平均値)\}^2/(データの個数)\)
  • 標準偏差:分散の平方根.通常の長さのばらつきを評価する際には同じ単位で理解したほうがわかりやすいために用いる.
    • \(\sigma\) という記号で表される.
  • その他,重要な指標
    • 最小値:そのデータの中で最も小さい値
    • 第一四分位数(25%パーセンタイル値):最小値と中央値の間の中央値
    • 中央値(第二四分位数):データを大きい(小さい)順に並べたとき,真ん中の値のこと(median).外れ値がある時に代表値として用いられる.
      • 奇数の場合:ちょうど真ん中が存在する.
      • 偶数の場合:真ん中の数字2つの平均値を中央値とする.
    • 最頻値:データの中で最も多く出てくる値のこと(mode).因子データの際に代表値として使われる.
    • 第三四分位数(75%パーセンタイル値):中央値と最大値の間の中央値
    • 最大値:そのデータの中で最も大きい数
    • 以下の2つは参考までに.
      • 平均偏差:「平均からの偏差」の絶対値の平均
      • 範囲:最大値から最小値の間.引き算で求められる.
平均値の計算
  • 7人の学生の体重が50, 60, 85, 70, 80, 67, 66kgであったする.これらの学生の体重の平均値を求めよ.
[1] 68.28571

オブジェクト指向

「オブジェクト」とは
  • 「オブジェクト」:データやモデル式などを入れる「何でも箱」
    • Rではモデル式,データなどをオブジェクトに入れて考える
    • 数式やデータをいちいち書くのは大変...
    • オブジェクトに入れることを「代入する」と言う

データセットを作ろう

7人の学生の体重が50, 60, 85, 70, 80, 67, 66kgであったする.このデータを変数名“weight”に代入する.

演習:

同じ7人の学生の身長が155, 164, 182, 165, 177, 177, 172cmであったとする.このデータを変数名“height”に代入せよ.

演習:

変数名“height”の合計・個数・平均値・中央値・最頻値を求めよ.

体重の記述統計量をまとめて算出する.

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  50.00   63.00   67.00   68.29   75.00   85.00 

左から順番に「最小値,第1四分位数,中央値,平均値,第3四分位数,最大値」を示しています.

演習:

変数名“height”の最小値・第1四分位数・中央値・平均値・第3四分位数・最大値を求めよ.   

分散と標準偏差を手計算で算出してみよう

分散を算出する

\[\sigma^2=\Sigma{((データの値)-(平均値)})^2/(データの個数)\]

ここでは,分母と分子に分けて話を進めていきましょう.

分子を計算する

体重の平均値をオブジェクトに入れる

“mean_weight”というオブジェクトを作って,体重の平均値を入れます.

平均からの偏差を求めて,オブジェクトに入れる

(データの値)-(weightの平均値)をして「平均からの偏差」を求めます.結果は“hensa_weight”に代入します.

「平均からの偏差」を2乗する
「平均からの偏差」を2乗します.“hensa_weight2”というオブジェクトを作って代入をしましょう.2乗しないとで全部足すと,数字は0になります.ただし,小数点以下を四捨五入しているので,ここでは完璧に0にはなりませんが,限りなく0に近くなります.
「平均からの偏差の2乗」を全部足してオブジェクトに入れる
これらの5つの値を合計した「平均からの偏差の二乗和」を求めます.“sum_hensa_weight2”という名前にしましょう.これで分子は完成です.

分母を計算する

データの個数を数えてオブジェクトに入れる
今度は分母を算出します.分母はデータ数です,“length_weight”というオブジェクトに代入しましょう.
最後の計算
これらを元に分散を算出します.分散は「平均からの偏差の二乗和」/「データ数」ですから,以下の通りに求められます.分散は“vari_weight”というオブジェクトに入れましょう
[1] 118.4898
標準偏差を算出する

標準偏差は分散の平方根です.平方根を求める関数は“sqrt()”であり,“hyohen_weight”というオブジェクトに入れてあげます.

[1] 10.8853

2種類の分散と標準偏差

「不偏分散・不偏標準偏差」と「標本分散・標本標準偏差」というものが出てきました.この話を理解するためには「母集団」と「標本」という話を理解する必要があります.ここでは簡単に,その2つの違いについてお話したいと思います.

私達が何かのデータを取る時は,全ての物事のデータを集めることが必ずしもできるとは限りません.例えば,「本学大学生1年生全員を対象としたアンケート」を実施すれば全てのデータを集めることができるかもしれませんが,「日本国民全てを対象としたアンケート」を集計するのは非常に困難です.

例えば,大学1年生の意見を調査することを目的として,1年生全員のデータをそのまま用いる分には問題ないのですが,「日本国民全てを対象としたアンケート」を実施するのはコストの面から考えても現実的ではありません.そのために,全体(母集団)の中から一部を取り出して(標本,サンプル),全体の意見・傾向を「推定」するという手法がとられるようになりました.

このような「推定」という手法を取る時に,“データ数”のままで分析するよりも“データ数-1”で計算してあげたほうがよりよい推定ができる,ということで“データ数-1”をするようになりました.

本当はもう少し細かな数学的な議論もあるのですが,入り込むと帰って来れなくなるのでここまでにしておこうと思います.とりあえず,これからは「不偏分散・不偏標準偏差」が使われることが多い,とだけ覚えておいて下さい.

データの整理②

  • 実施した調査によるデータ(調査が間に合わなければ,その他のデータ)を用いて, 記述統計量の算出手法について学ぶ.

他のデータを読み込む

今は皆さんに手入力でデータを打ち込んで貰いました.今度は,皆さんには“csvファイル”からデータを読み込んでもらおうと思います.Rの標準のデータ形式以外の他の形式のファイルを読み込むことを「インポート」と言います.

RStudioを使ってもらうと,次の手順でデータを読み込むことができます.

  • “Import Dataset”をクリックする.
    • “From Text (readr)…”をクリックする.
  • “Browse”をクリックする
    • 読み込みたいデータを選んで“Open”をクリックする.
    • データに併せて,クリックしていく.
      • 今回の場合は“First Row as Names”にチェックを入れる.これは1行目が各行のデータ名を示しているためである.
  • “Import”をクリックしてデータを読み込む.
  • 完了

下のコンソールには3つのコードが書かれます.1番目のコードは“readr”というパッケージを使うように,という支持をしています.2番目のコードは“データを読み込んで,こんな名前にしておいて下さい”を示しており,3番目のコードは“読み込んだデータを表示して下さい”を示している.

なお,このコード(特に上の2つ)は“>”を取り除いて上の“.R”ファイルに保存しておくと,次回以降便利であることが多い. その時に,こんな感じに説明書きも入れておくと良いと思います..

library(readr)
dataset <- read_csv("~/hogehoge/dataset.csv")

なお,この“hogehoge”は読み込んだデータの場所を示しており,人によって異なるので注意してください.

注意:データについて

このデータはゴトウが実施した1926人分のデータのうち,ランダムに選んだ963人分のデータです.このデータの取扱いについては,現在分析中&論文として執筆中なので細心の注意を払って下さい.まだ,データの中身は「アンケート案」に記載してあるので,そちらを参考にしてください.

読み込んだデータの記述統計量を算出します.ここでは人々の主観的幸福度について記述統計量を算出します.

主観的幸福度とは:

主観的幸福度とは人が感じている幸福度を示したものです.ここでは「現在,あなたはどの程度幸せですか?「とても幸せ」を10点,「とても不幸せ」を0点とすると,何点くらいになると思いますか?」として尋ねたものです.昨今では主観的幸福度は「幸福の経済学」という分野で注目されています.

それでは,記述統計量を出してみましょう.特に,複数列あるデータの場合は$を使って,「このデータセットの中のこのデータの平均値を出して下さい」というように指定してあげます.

 

  • 平均・分散・標準偏差・度数など.

平均値を算出してみる.

主観的幸福度(SUB_HAP)の平均値
[1] 6.002077

分散を算出してみる.

主観的幸福度(SUB_HAP)の分散
[1] 5.503114

標準偏差を算出してみる.

主観的幸福度(SUB_HAP)の標準偏差
[1] 2.345872
主観的幸福度(SUB_HAP)のヒストグラム

頻度を数えてみる.


  1   2   3   4 
153 381 355  74 

ついでにヒストグラムも作ってみよう

世代の頻度を数えてみる.


10dai 20dai 30dai 40dai 50dai 60dai 70dai 
    8   140   361   358    77    18     1 

 

  • 基本的には『関数』を用いた計算方法を紹介する.

 

実はこんなこともできる.

Skim summary statistics
n obs: 963
n variables: 54

variable missing complete n min max empty n_unique
F_FGR 0 963 963 7 9 0 11
F_GEN 0 963 963 5 5 0 7
F_GEN_2 0 963 963 3 5 0 12
F_INK 0 963 963 2 10 0 10
F_INS 0 963 963 2 10 0 11
F_SEX 0 963 963 4 6 0 3
F_TAN 0 963 963 5 15 0 13
SEX_NIN 340 623 963 5 10 0 12
SEX_OBJ 157 806 963 4 5 0 4
Table continues below
variable missing complete n n_unique top_counts
ARE 0 963 963 8 Kan: 376, Kin: 165, Chu: 148, Kyu: 92
CHI 0 963 963 2 Chi: 495, NoC: 468, NA: 0
MAR 0 963 963 2 Mar: 569, Not: 394, NA: 0
ordered
FALSE
FALSE
FALSE
Table continues below
variable missing complete n mean sd p0 p25 p50
DED_JIG 0 963 963 2.32 0.83 1 2 2
DED_KIS 0 963 963 3 0.77 1 3 3
DED_PUN 0 963 963 2.74 0.84 1 2 3
DED_SHI 0 963 963 2.54 0.87 1 2 3
DED_TEN 0 963 963 2.41 0.84 1 2 2
DIC_FRI 0 963 963 3.47 2.62 0 1 3
DIC_OTH 0 963 963 0.9 1.85 0 0 0
DIC_PAR 0 963 963 5.65 3.34 0 4 5
F_INK_cen 67 896 963 2.83 2.6 0 1 3
F_INS_cen 166 797 963 5.63 3.33 0 3 5
ID 0 963 963 482 278.14 1 241.5 482
KAN_KYK 0 963 963 3.02 0.58 1 3 3
KAN_PRD 0 963 963 2.23 0.81 1 2 2
KAN_SEC 0 963 963 2.28 0.82 1 2 2
KAN_SUP 0 963 963 2.18 0.86 1 2 2
KAN_THI 0 963 963 2.03 0.82 1 1 2
PRE 0 963 963 20.01 11.44 1 12 15
SEX_IMP 143 820 963 3.79 1.51 1 3 4
SEX_IMP_num 143 820 963 3.79 1.51 1 3 4
SEX_MAS 379 584 963 4.27 2.83 0 2 5
SEX_MAS_nen 379 584 963 80.78 137.85 0 2 26
SEX_NIN_cen 340 623 963 10.36 18.58 0 2.5 4.5
SEX_NNA 0 963 963 1.48 1.72 0 0 1
SEX_SEX 407 556 963 3.4 2.13 0 1 4
SEX_SEX_nen 407 556 963 26.26 66.56 0 1 12
SPN_FEA 0 963 963 2.96 0.81 1 3 3
SPN_IMP 0 963 963 3.44 0.68 1 3 4
SPN_LIV 0 963 963 2.88 0.8 1 2 3
SPN_THK 0 963 963 2.84 0.77 1 2 3
SPN_UNM 0 963 963 2.36 0.84 1 2 2
SUB_HAP 0 963 963 6 2.35 0 5 6
SUB_SAT 0 963 963 5.43 2.42 0 4 5
SUB_SLP 0 963 963 5.93 2.52 0 4 6
TRU_FRI 0 963 963 5.05 2.94 0 3 5
TRU_OTH 0 963 963 2.72 2.73 0 0 2
TRU_PAR 0 963 963 6.55 3.24 0 5 5
ULT_PRO_FRI 0 963 963 4.55 1.81 0 4 5
ULT_PRO_OTH 0 963 963 3.13 2.38 0 0 4
ULT_PRO_PAR 0 963 963 5.52 2.51 0 5 5
ULT_REC_FRI 0 963 963 3.44 2.03 0 2 4
ULT_REC_OTH 0 963 963 2.86 2.49 0 0 3
ULT_REC_PAR 0 963 963 3.82 2.71 0 1 5
p75 p100 hist
3 4 ▃▁▇▁▁▆▁▁
3 4 ▁▁▂▁▁▇▁▃
3 4 ▂▁▃▁▁▇▁▂
3 4 ▂▁▅▁▁▇▁▂
3 4 ▃▁▇▁▁▇▁▂
5 10 ▆▂▅▇▁▁▁▂
1 10 ▇▁▁▁▁▁▁▁
10 10 ▃▁▂▇▁▁▁▆
5 20 ▇▇▁▁▁▁▁▁
7 20 ▁▇▃▁▁▁▁▁
722.5 963 ▇▇▇▇▇▇▇▇
3 4 ▁▁▁▁▁▇▁▂
3 4 ▃▁▇▁▁▇▁▁
3 4 ▃▁▇▁▁▇▁▁
3 4 ▅▁▇▁▁▆▁▁
3 4 ▅▁▇▁▁▅▁▁
27 47 ▃▆▇▃▅▂▂▂
5 7 ▂▃▅▇▁▆▂▁
5 7 ▂▃▅▇▁▆▂▁
7 9 ▇▂▁▅▃▅▆▃
130 730 ▇▂▁▁▁▁▁▁
9 101 ▇▁▁▁▁▁▁▁
3 5 ▇▂▁▂▂▁▂▂
5 9 ▇▃▃▆▅▅▂▁
26 730 ▇▁▁▁▁▁▁▁
3 4 ▁▁▂▁▁▇▁▃
4 4 ▁▁▁▁▁▆▁▇
3 4 ▁▁▃▁▁▇▁▃
3 4 ▁▁▂▁▁▇▁▂
3 4 ▃▁▇▁▁▇▁▂
8 10 ▂▁▂▇▅▆▅▅
7 10 ▂▂▃▇▃▅▃▂
8 10 ▁▁▃▇▃▅▅▅
6 10 ▂▂▃▇▁▁▁▃
5 10 ▇▂▃▅▁▁▁▁
10 10 ▂▁▂▆▁▁▁▇
5 10 ▁▁▁▇▁▁▁▁
5 10 ▆▁▂▇▁▁▁▁
6 10 ▁▁▁▇▁▁▁▂
5 10 ▃▂▃▇▁▁▁▁
5 10 ▇▂▂▇▁▁▁▁
5 10 ▅▁▂▇▁▁▁▂

今日のTake Home Messages

  • 記述統計量はデータの全般的な傾向を把握するために大事な値
  • 1つ1つ計算していくこともできるが,Rでは関数を使って一発で計算できる.
  • 今,何のデータを扱っているのか意識しながら分析しよう.

Rでデータを扱う時に注意すべきこと

  • 必ず数字/文字は半角で入力する.
  • 日本語は使わずにローマ字を使用する.
  • コメントアウト(コードではなく,関係ないメモを入れること)をするときは半角の「#」から始める.
    • メモする内容は全角でもよい.
  • ファイル名およびパスには決して全角の文字(ひらがな,カタカナ,漢字,全角スペースなど)を入れてはいけない.
    • 半角英数字だけにする.
  • 慌てずに落ち着いて操作すれば,決して難しくない.
    • 1つずつ落ち着いて作業することを心がける.
  • 「わからない」ことを恐れない
    • 周りの友人に聞いたり,教員に確認したりしよう.

演習問題

問題

問題

演習問題:

  • 次回までにご自身で分析してみたいテーマ(回帰分析1つ)+(t検定1つ)+(分散分析1つ)の帰無仮説と対立仮説を考えてきてください.

  • 以下の問題を解きましょう.

リアクションペーパー:

  • 授業で学んだことおよび感想を下記リンクからお答えください.

リアクションペーパー

ヒント

  • こんなことがかかわるかも?
    • なんて,演習問題によってヒントが出たり何だりします.
    • ヒントがない時は気合でがんばりましょう.

データの概要

データ概要

ダウンロードはコチラから

変数名リスト

主観的指標

項目名 データタイトル 質問項目 回答
主観的幸福度 SUB_HAP 現在,あなたはどの程度幸せですか?「とても幸せ」を10点,「とても不幸せ」を0点とすると,何点くらいになると思いますか?* 0点「とても不幸せ」-10点「とても幸せ」
生活満足度 SUB_SAT あなたは全体として最近の生活にどの程度満足していますか?「とても満足」を10点,「とても不満足」を0点とすると,何点くらいになると思いますか? 0点「とても不満足」-10点「とても満足」
生活満足度 SUB_SLP あなたは最近,どの程度眠れていますか?「とても眠れている」を10点,「全く眠れていない」を0点とすると,何点くらいになると思いますか? 0点「全く眠れていない」-10点「とても眠れている」

独裁者ゲーム

図を見て下さい.
あなたはAさんです. あなたはTポイントを10ポイントを受け取りました.
そのうち,あなたはBさんに何ポイントかを渡すことができます.
さて,あなたはBさんに何ポイント渡しますか?
ここでは以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
主観的幸福度 DIC_PAR Bさんが両親の場合 0ポイント-10ポイント
DG友人条件 DIC_FRI Bさんが友人の場合 0ポイント-10ポイント
DG他者条件 DIC_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

最終提案ゲーム_提案者

図を見て下さい.
あなたはAさんです. あなたはTポイントを10ポイントを受け取りました.
そのうち,あなたはBさんとポイントを分け合うことになりました.
あなたは,Bさんに対して分け合うポイントを提案することができます.
あなたは,10ポイントの中から,Bさんに対して分けたポイントを引いた残りを受け取ることができます.
しかし,Bさんがあなたの提案を拒否した場合には,その提案は実現せずに,
お互いポイントをもらえないことになります.
さて,あなたはBさんに何ポイント渡すことを提案しますか?
ここでは以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
最終提案提案者両親条件 ULT_PRO_PAR Bさんが両親の場合 0ポイント-10ポイント
最終提案提案者友人条件 ULT_PRO_FRI Bさんが友人の場合 0ポイント-10ポイント
最終提案提案者他者条件 ULT_PRO_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

最終提案ゲーム_応答者

図を見て下さい. あなたはBさんです. AさんはTポイントを10ポイントを受け取りました.
Aさんが,あなたに対して分け合うポイントを提案します.
Aさんは,10ポイントの中から,あなたに対して分けたポイントを引いた残りを受け取ることができます.
しかし,あなたがAさんの提案を拒否した場合には,その提案は実現せずに,
お互いポイントをもらえないことになります.
さて,最低でも何ポイントの提案を受けたら,Aさんの提案を受け入れますか?
ここでは以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
最終提案応答者両親条件 ULT_REC_PAR Bさんが両親の場合 0ポイント-10ポイント
最終提案応答者友人条件 ULT_REC_FRI Bさんが友人の場合 0ポイント-10ポイント
最終提案応答者他者条件 ULT_REC_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

信頼ゲーム

図を見て下さい.
あなたはAさんです. あなたはTポイントを10ポイント持っています.
いくらかをCさんにあずけてください. CさんはあなたからあずかったTポイントを3倍にしてBさんに渡します.
Bさんは手元に渡されたポイントのうち,いくらかをあなたに返します.
この時,あなたはCさんにいくらあずけますか?
ここではBさんが以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
信頼両親条件 TRU_PAR Bさんが両親の場合 0ポイント-10ポイント
信頼友人条件 TRU_FRI Bさんが友人の場合 0ポイント-10ポイント
信頼他者条件 TRU_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

自然関連

以下の質問について4点満点でお答えください.

項目名 データタイトル 質問項目 回答
自然運命 SPN_UNM 何かの大きな力に自分の運命は動かされているように感じることがある. 1全くそう思わない-4非常にそう思う
自然感謝 SPN_THK 自然などの人間を超えた力に感謝の気持ちを持つことがある. 1全くそう思わない-4非常にそう思う
自然恐怖 SPN_FEA 自然などの人間を超えた力に恐れの気持ちを持つことがある. 1全くそう思わない-4非常にそう思う
自然生存 SPN_LIV 自然などの人間を超えた力によって,生かされていると思うことがある. 1全くそう思わない-4非常にそう思う
自然大切 SPN_IMP 自然は大切な存在である. 1全くそう思わない-4非常にそう思う

監視

以下の質問について4点満点でお答えください.

項目名 データタイトル 質問項目 回答
第2者被監視感 KAN_SEC 日常生活の中で,直接誰か(人間)に見られていると思うことがある. 1全くそう思わない-4非常にそう思う
第3者被監視感 KAN_THI 日常生活の中で,監視カメラ等を通じて誰か(人間)に間接的に見られていると思うことがある. 1全くそう思わない-4非常にそう思う
超自然的被監視感 KAN_SUP 日常生活の中で,超自然的な存在に見られていると思うことがある. 1全くそう思わない-4非常にそう思う
第2者被監視感 KAN_PRD 無機物の中に,人間の表情のようなものを見出すことがある. 1全くそう思わない-4非常にそう思う
自然大切 KAN_KYK 人に対して共感をすることがある. 1全くそう思わない-4非常にそう思う

死後

以下の質問について4点満点でお答えください.

項目名 データタイトル 質問項目 回答
死後世界 DED_SHI 「死後の世界」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
天国 DED_TEN 「天国」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
地獄 DED_JIG 「地獄」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
奇跡 DED_KIS 「奇跡」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
天罰 DED_PUN 「天罰」が存在すると思いますか? 1全くそう思わない-4非常にそう思う

性行動

以下の質問についてお答えください.

項目名 データタイトル 質問項目 回答
性衝動 SEX_IMP,SEX_IMP_num(数値,欠損値有り) あなたの性衝動はどの程度強いと思いますか?7点満点でお答え下さい.なお,答えたくない方は「8.答えたくない」を選んで下さい. 全く弱い.2. 弱い.3. どちらかと言えば弱い.4. どちらとも言えない.5. どちらかと言えば強い.6. 強い.7. 非常に強い.8. 答えたくない.
自慰回数 SEX_MAS,SEX_MAS_nen(年間回数): あなたはどの程度の頻度でマスターベーションをしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」
性交渉回数 SEX_SEX,SEX_SEX_nen(年間回数) あなたはどの程度の頻度で性交渉(性行為)をしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」
性衝動対象 SEX_OBJ あなたの性衝動の対象として当てはまる選択肢を選んで下さい.なお,答えたくない方は「5.答えたくない」を選んで下さい. 1.異性, 2. 同性,3. 両方,4. その他,5. 答えたくない
天罰 SEX_NIN,SEX_NIN_cen(中央値) あなたが性交渉(性行為)をしたことがある人数を教えて下さい.* 性交渉を(性行為)したことがない場合は「0. 0人」を選んで下さい. また,答えたくない方は「12.答えたくない」を選んで下さい. 1. 0人 「0」, 2. 1人 「1」, 3. 2〜3人 「2.5」, 4. 4〜5人 「4.5」, 5. 5〜7人 「6」, 6. 8〜10人 「9」, 7. 11〜15人 「13」, 8. 16〜20人 「18」, 9. 21〜30人 「25.5」, 10. 31〜40人 「35.5」, 11. 41〜100人 「70.5」, 12. 101人以上 「101」, 13. 答えたくない.「NA」
性情報開示 SEX_NNA 性情報に対して開示しなかった個数 上記5つについて答えたくないを選んだ個数

フェイスシート

あなたのことについて教えて下さい.

項目名 データタイトル 質問項目 回答
性別 F_SEX あなたの性別を教えて下さい. 1.男性, 2.女性,3.その他
世代 F_GEN あなたの年齢を教えて下さい. 1. 10代前半, 2. 10代後半, 3. 20代前半, 4. 20代後半, 5. 30代前半, 6. 30代後半, 7. 40代前半, 8. 40代後半, 9. 50代前半, 10. 50代前半, 11. 60代前半, 12. 60代後半, 13. 70代以降
最終学歴 F_FGR あなたの最終学歴を教えて下さい. 1. 中学校卒業, 2. 高校中退, 3. 高校卒業, 4. 専門学校(短期大学)中退, 5. 専門学校(短期大学)卒業, 6. 大学中退, 7. 大学卒業, 8. 大学院修士課程(博士前期課程)中退, 9. 大学院修士課程(博士前期課程)修了, 10. 大学院博士課程(博士後期課程)中退, 11. 大学院博士課程(博士後期課程)修了
個人収入 F_INK,F_INK_cen(中央値,百万円) あなた個人の年収を教えて下さい. 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない
世帯収入 F_INS,F_INS_cen(中央値,百万円) あなたの世帯での収入の合計を教えて下さい. 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない
回答端末 F_TAN あなたが現在回答に使われているケータイ/タブレット/パソコンについて,当てはまるものを選んで下さい. 1. パソコン(Windows), 2. パソコン(Mac), 3. パソコン(その他), 4. タブレット(Windows), 5. タブレット(iOS,iPad), 6. タブレット(android), 7. タブレット(その他), 8. スマホ(Windows), 9. スマホ(iOS,iPhone), 10. スマホ(android), 11. スマホ(その他), 12. ガラケー,フィーチャーホン, 13. その他
都道府県 PRE あなたのお住まいの県を教えて下さい. 1. 北海道2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県36. 徳島県37. 香川県38. 愛媛県39. 高知県40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県
地域 ARE 都道府県から地域に変換 北海道:1. 北海道,東北地方:2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県,関東地方:8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県,中部地方:15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県,近畿地方:25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県,中国地方:31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県,四国地方:36. 徳島県37. 香川県38. 愛媛県39. 高知県,九州地方:40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県
未既婚 MAR あなたはご結婚されていますか? NotMarried:未婚,Married:既婚
子の有無 CHI あなたはお子さんがいらっしゃいますか? NoChild:いない,Child:いる
---
title: "データ解析論I第3講"
output: 
  flexdashboard::flex_dashboard:
    vertical-layout: scroll
    orientation: columns
    source_code: embed
    theme: journal
    toc: true
    toc_depth: 2
    fig_mobile: true
    highlight: pygments
    css: styles_customized.css

---

```{r setup, include=FALSE}
library(flexdashboard)
library(readr)
exdataset <- read_csv("/Users/akira/Dropbox/Education/2019MEIJI/[3_Wed2]Data_Analytics/analysis/data/exdataset.csv")
library(ggplot2)

## Reordering exdataset$ARE
exdataset$ARE <- factor(exdataset$ARE, levels=c("Kanto", "Hokkaido", "Tohoku", "Chubu", "Kinki", "Chugoku", "Shikoku", "Kyushu"))

## Reordering exdataset$MAR
exdataset$MAR <- factor(exdataset$MAR, levels=c("NotMarried", "Married"))

## Reordering exdataset$CHI
exdataset$CHI <- factor(exdataset$CHI, levels=c("NoChild", "Child"))

```




# 講義資料


## メイン資料 {.tabset .tabset-fade}

### 今日の資料はコチラから.

スマホで見る方は**QRコード**を読み込んでください
### 講義資料 #### 平均値・分散・標準偏差とは? * 平均値:全てのデータを足して割ったもの.一般的に代表値(データ全体を表している数値)として扱われる. * 分散:平均値とそれぞれの値の差を求めて2乗して,合計したものをデータの個数で割ったもの.データの散らばり具合を示す数値であり,分散が大きければ大きいほど,データが散らばっていることを示す. - $\sigma^2$ という記号で表される. - \((分散)=\Sigma\{(データの値)-(平均値)\}^2/(データの個数)\) * 標準偏差:分散の平方根.通常の長さのばらつきを評価する際には同じ単位で理解したほうがわかりやすいために用いる. - $\sigma$ という記号で表される. * その他,重要な指標 - 最小値:そのデータの中で最も小さい値 - 第一四分位数(25\%パーセンタイル値):最小値と中央値の間の中央値 - 中央値(第二四分位数):データを大きい(小さい)順に並べたとき,真ん中の値のこと(median).外れ値がある時に代表値として用いられる. - 奇数の場合:ちょうど真ん中が存在する. - 偶数の場合:真ん中の数字2つの平均値を中央値とする. - 最頻値:データの中で最も多く出てくる値のこと(mode).因子データの際に代表値として使われる. - 第三四分位数(75\%パーセンタイル値):中央値と最大値の間の中央値 - 最大値:そのデータの中で最も大きい数 - 以下の2つは参考までに. - 平均偏差:「平均からの偏差」の絶対値の平均 - 範囲:最大値から最小値の間.引き算で求められる. ##### 平均値の計算 * 7人の学生の体重が50, 60, 85, 70, 80, 67, 66kgであったする.これらの学生の体重の平均値を求めよ. ```{r echo=TRUE} # 平均値=(それぞれのデータの値の合計)/(データの個数) (50+60+85+70+80+67+66)/7 ``` #### オブジェクト指向 ##### 「オブジェクト」とは * 「オブジェクト」:データやモデル式などを入れる「何でも箱」 - Rではモデル式,データなどをオブジェクトに入れて考える - 数式やデータをいちいち書くのは大変... - オブジェクトに入れることを「代入する」と言う #### データセットを作ろう 7人の学生の体重が50, 60, 85, 70, 80, 67, 66kgであったする.このデータを変数名"weight"に代入する. ```{r} weight<-c(50, 60, 85, 70, 80, 67, 66) ``` #### 演習: 同じ7人の学生の身長が155, 164, 182, 165, 177, 177, 172cmであったとする.このデータを変数名"height"に代入せよ. #### 記述統計量を色々出してみる. ```{r echo=T} sum(weight)/7 #sum()という関数で合計を算出できる. sum(weight)/length(weight) #length()という関数でデータの個数を数えてくれる. mean(weight) #実はmean()という関数を使うと一発で出てしまう. median(weight) #中央値はmedian()という関数で出せる. table(weight) #最頻値はtable()という関数を使って探し出す.ちなみに,"weight"の中に最頻値は存在していない.(全てが最頻値=1) ``` #### 演習: 変数名"height"の合計・個数・平均値・中央値・最頻値を求めよ. #### 体重の記述統計量をまとめて算出する. ```{r echo=T} summary(weight) ``` 左から順番に「最小値,第1四分位数,中央値,平均値,第3四分位数,最大値」を示しています. #### 演習: 変数名"height"の最小値・第1四分位数・中央値・平均値・第3四分位数・最大値を求めよ.    #### 分散と標準偏差を手計算で算出してみよう #### 分散を算出する $$\sigma^2=\Sigma{((データの値)-(平均値)})^2/(データの個数)$$ ここでは,分母と分子に分けて話を進めていきましょう. #### 分子を計算する #### 体重の平均値をオブジェクトに入れる "mean_weight"というオブジェクトを作って,体重の平均値を入れます. ```{r echo=T} mean_weight <- mean(weight) ``` #### 平均からの偏差を求めて,オブジェクトに入れる (データの値)-(weightの平均値)をして「平均からの偏差」を求めます.結果は"hensa_weight"に代入します. ```{r echo=T} hensa_weight <- weight - mean_weight ``` ##### 「平均からの偏差」を2乗する 「平均からの偏差」を2乗します."hensa_weight2"というオブジェクトを作って代入をしましょう.2乗しないとで全部足すと,数字は0になります.ただし,小数点以下を四捨五入しているので,ここでは完璧に0にはなりませんが,限りなく0に近くなります. ```{r echo=T} hensa_weight2 <- hensa_weight^2 ``` ##### 「平均からの偏差の2乗」を全部足してオブジェクトに入れる これらの5つの値を合計した「平均からの偏差の二乗和」を求めます."sum_hensa_weight2"という名前にしましょう.これで分子は完成です. ```{r echo=T} sum_hensa_weight2<-sum(hensa_weight2) ``` #### 分母を計算する ##### データの個数を数えてオブジェクトに入れる 今度は分母を算出します.分母はデータ数です,"length_weight"というオブジェクトに代入しましょう. ```{r echo=T} length_weight<-length(weight) ``` ##### 最後の計算 これらを元に分散を算出します.分散は「平均からの偏差の二乗和」/「データ数」ですから,以下の通りに求められます.分散は"vari_weight"というオブジェクトに入れましょう ```{r echo=T} vari_weight<-sum_hensa_weight2/length_weight vari_weight ``` ##### 標準偏差を算出する 標準偏差は分散の平方根です.平方根を求める関数は"sqrt()"であり,"hyohen_weight"というオブジェクトに入れてあげます. ```{r echo=T} hyohen_weight <- sqrt(vari_weight) hyohen_weight ``` #### 2種類の分散と標準偏差 「不偏分散・不偏標準偏差」と「標本分散・標本標準偏差」というものが出てきました.この話を理解するためには「母集団」と「標本」という話を理解する必要があります.ここでは簡単に,その2つの違いについてお話したいと思います. 私達が何かのデータを取る時は,全ての物事のデータを集めることが必ずしもできるとは限りません.例えば,「本学大学生1年生全員を対象としたアンケート」を実施すれば全てのデータを集めることができるかもしれませんが,「日本国民全てを対象としたアンケート」を集計するのは非常に困難です. 例えば,大学1年生の意見を調査することを目的として,1年生全員のデータをそのまま用いる分には問題ないのですが,「日本国民全てを対象としたアンケート」を実施するのはコストの面から考えても現実的ではありません.そのために,全体(母集団)の中から一部を取り出して(標本,サンプル),全体の意見・傾向を「推定」するという手法がとられるようになりました. このような「推定」という手法を取る時に,"データ数"のままで分析するよりも"データ数-1"で計算してあげたほうがよりよい推定ができる,ということで"データ数-1"をするようになりました. 本当はもう少し細かな数学的な議論もあるのですが,入り込むと帰って来れなくなるのでここまでにしておこうと思います.とりあえず,これからは「不偏分散・不偏標準偏差」が使われることが多い,とだけ覚えておいて下さい. #### データの整理② * 実施した調査によるデータ(調査が間に合わなければ,その他のデータ)を用いて, 記述統計量の算出手法について学ぶ. #### 他のデータを読み込む 今は皆さんに手入力でデータを打ち込んで貰いました.今度は,皆さんには"csvファイル"からデータを読み込んでもらおうと思います.Rの標準のデータ形式以外の他の形式のファイルを読み込むことを「インポート」と言います. RStudioを使ってもらうと,次の手順でデータを読み込むことができます. * "Import Dataset"をクリックする. - "From Text (readr)..."をクリックする. * "Browse"をクリックする - 読み込みたいデータを選んで"Open"をクリックする. - データに併せて,クリックしていく. - 今回の場合は"First Row as Names"にチェックを入れる.これは1行目が各行のデータ名を示しているためである. * "Import"をクリックしてデータを読み込む. * 完了 下のコンソールには3つのコードが書かれます.1番目のコードは"readr"というパッケージを使うように,という支持をしています.2番目のコードは"データを読み込んで,こんな名前にしておいて下さい"を示しており,3番目のコードは"読み込んだデータを表示して下さい"を示している. なお,このコード(特に上の2つ)は">"を取り除いて上の".R"ファイルに保存しておくと,次回以降便利であることが多い. その時に,こんな感じに説明書きも入れておくと良いと思います.. ``` library(readr) dataset <- read_csv("~/hogehoge/dataset.csv") ``` なお,この"hogehoge"は読み込んだデータの場所を示しており,人によって異なるので注意してください. ##### 注意:データについて このデータはゴトウが実施した1926人分のデータのうち,ランダムに選んだ963人分のデータです.このデータの取扱いについては,現在分析中&論文として執筆中なので細心の注意を払って下さい.まだ,データの中身は「アンケート案」に記載してあるので,そちらを参考にしてください. 読み込んだデータの記述統計量を算出します.ここでは人々の主観的幸福度について記述統計量を算出します. #### 主観的幸福度とは: 主観的幸福度とは人が感じている幸福度を示したものです.ここでは「現在,あなたはどの程度幸せですか?「とても幸せ」を10点,「とても不幸せ」を0点とすると,何点くらいになると思いますか?」として尋ねたものです.昨今では主観的幸福度は「幸福の経済学」という分野で注目されています. それでは,記述統計量を出してみましょう.特に,複数列あるデータの場合は\$を使って,「このデータセットの中のこのデータの平均値を出して下さい」というように指定してあげます.   * 平均・分散・標準偏差・度数など. ```{r dataを読み込む, echo=TRUE} library(readr) exdataset <- read_csv("/Users/akira/Dropbox/Education/2019MEIJI/[3_Wed2]Data_Analytics/analysis/data/exdataset.csv") library(ggplot2) ## Reordering exdataset$ARE exdataset$ARE <- factor(exdataset$ARE, levels=c("Kanto", "Hokkaido", "Tohoku", "Chubu", "Kinki", "Chugoku", "Shikoku", "Kyushu")) ## Reordering exdataset$MAR exdataset$MAR <- factor(exdataset$MAR, levels=c("NotMarried", "Married")) ## Reordering exdataset$CHI exdataset$CHI <- factor(exdataset$CHI, levels=c("NoChild", "Child")) ``` #### **平均値**を算出してみる. 主観的幸福度(SUB_HAP)の平均値 ```{r 主観的幸福度の平均値, echo=TRUE} mean(exdataset$SUB_HAP) ``` #### **分散**を算出してみる. 主観的幸福度(SUB_HAP)の分散 ```{r 主観的幸福度の分散, echo=TRUE} var(exdataset$SUB_HAP) ``` #### **標準偏差**を算出してみる. 主観的幸福度(SUB_HAP)の標準偏差 ```{r 主観的幸福度の標準偏差, echo=TRUE} sd(exdataset$SUB_HAP) ``` 主観的幸福度(SUB_HAP)のヒストグラム ```{r 主観的幸福度のヒストグラム, echo=TRUE} g <- ggplot(exdataset, aes(x = SUB_HAP)) + geom_histogram(binwidth = 1.0) g ``` #### **頻度**を数えてみる. ```{r 運命の頻度, echo=TRUE} table(exdataset$SPN_UNM) ``` #### ついでにヒストグラムも作ってみよう ```{r 運命のヒストグラム, echo=TRUE} g <- ggplot(exdataset, aes(x = SPN_UNM)) + geom_histogram(binwidth = 1.0) g ``` #### 世代の頻度を数えてみる. ```{r 世代の頻度, echo=TRUE} table(exdataset$F_GEN) ```   * 基本的には『関数』を用いた計算方法を紹介する.   #### 実はこんなこともできる. ```{r} library(skimr) skim(exdataset) %>% pander() ``` ### 今日のTake Home Messages * **記述統計量**はデータの全般的な傾向を把握するために大事な値 * 1つ1つ計算していくこともできるが,Rでは**関数**を使って一発で計算できる. * 今,何のデータを扱っているのか意識しながら分析しよう. ```{r} ``` ### Rでデータを扱う時に注意すべきこと * 必ず数字/文字は半角で入力する. * 日本語は使わずにローマ字を使用する. * コメントアウト(コードではなく,関係ないメモを入れること)をするときは半角の「#」から始める. - メモする内容は全角でもよい. * ファイル名およびパスには決して全角の文字(ひらがな,カタカナ,漢字,全角スペースなど)を入れてはいけない. - 半角英数字だけにする. * 慌てずに落ち着いて操作すれば,決して難しくない. - 1つずつ落ち着いて作業することを心がける. * 「わからない」ことを恐れない - 周りの友人に聞いたり,教員に確認したりしよう. # 演習問題 ## 問題 ### 問題 #### 演習問題: * 次回までにご自身で分析してみたいテーマ(回帰分析1つ)+(t検定1つ)+(分散分析1つ)の帰無仮説と対立仮説を考えてきてください. * 以下の問題を解きましょう. #### リアクションペーパー: * 授業で学んだことおよび感想を下記リンクからお答えください. **[リアクションペーパー](https://forms.gle/jhMGgdhyb3sMgpWm7)** ### ヒント * こんなことがかかわるかも? - なんて,演習問題によってヒントが出たり何だりします. - ヒントがない時は気合でがんばりましょう. ```{r} ``` # データの概要 ### データ概要 ダウンロードは**[コチラ](https://akrgt.github.io/2019DA/data/exdataset.csv)**から ```{r} library(DT) DT::datatable(exdataset) ``` ### 変数名リスト #### 主観的指標 | 項目名 | データタイトル | 質問項目 | 回答 | | ------------ | -------------- | ------------------------------------------------------------ | ------------------------------------------------ | | 主観的幸福度 | SUB_HAP | 現在,あなたはどの程度幸せですか?「とても幸せ」を10点,「とても不幸せ」を0点とすると,何点くらいになると思いますか?* | 0点「とても不幸せ」-10点「とても幸せ」 | | 生活満足度 | SUB_SAT | あなたは全体として最近の生活にどの程度満足していますか?「とても満足」を10点,「とても不満足」を0点とすると,何点くらいになると思いますか? | 0点「とても不満足」-10点「とても満足」 | | 生活満足度 | SUB_SLP | あなたは最近,どの程度眠れていますか?「とても眠れている」を10点,「全く眠れていない」を0点とすると,何点くらいになると思いますか? | 0点「全く眠れていない」-10点「とても眠れている」 | #### 独裁者ゲーム 図を見て下さい. あなたはAさんです. あなたはTポイントを10ポイントを受け取りました. そのうち,あなたはBさんに何ポイントかを渡すことができます. さて,あなたはBさんに何ポイント渡しますか? ここでは以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ------------ | -------------- | ----------------------------- | -------------------- | | 主観的幸福度 | DIC_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | DG友人条件 | DIC_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | DG他者条件 | DIC_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 最終提案ゲーム_提案者 図を見て下さい. あなたはAさんです. あなたはTポイントを10ポイントを受け取りました. そのうち,あなたはBさんとポイントを分け合うことになりました. あなたは,Bさんに対して分け合うポイントを提案することができます. あなたは,10ポイントの中から,Bさんに対して分けたポイントを引いた残りを受け取ることができます. しかし,Bさんがあなたの提案を拒否した場合には,その提案は実現せずに, お互いポイントをもらえないことになります. さて,あなたはBさんに何ポイント渡すことを提案しますか? ここでは以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------------------- | -------------- | ----------------------------- | -------------------- | | 最終提案提案者両親条件 | ULT_PRO_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | 最終提案提案者友人条件 | ULT_PRO_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | 最終提案提案者他者条件 | ULT_PRO_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 最終提案ゲーム_応答者 図を見て下さい. あなたはBさんです. AさんはTポイントを10ポイントを受け取りました. Aさんが,あなたに対して分け合うポイントを提案します. Aさんは,10ポイントの中から,あなたに対して分けたポイントを引いた残りを受け取ることができます. しかし,あなたがAさんの提案を拒否した場合には,その提案は実現せずに, お互いポイントをもらえないことになります. さて,最低でも何ポイントの提案を受けたら,Aさんの提案を受け入れますか? ここでは以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------------------- | -------------- | ----------------------------- | -------------------- | | 最終提案応答者両親条件 | ULT_REC_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | 最終提案応答者友人条件 | ULT_REC_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | 最終提案応答者他者条件 | ULT_REC_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 信頼ゲーム 図を見て下さい. あなたはAさんです. あなたはTポイントを10ポイント持っています. いくらかをCさんにあずけてください. CさんはあなたからあずかったTポイントを3倍にしてBさんに渡します. Bさんは手元に渡されたポイントのうち,いくらかをあなたに返します. この時,あなたはCさんにいくらあずけますか? ここではBさんが以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ------------ | -------------- | ----------------------------- | -------------------- | | 信頼両親条件 | TRU_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | 信頼友人条件 | TRU_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | 信頼他者条件 | TRU_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 自然関連 以下の質問について4点満点でお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | -------- | -------------- | ------------------------------------------------------------ | --------------------------------- | | 自然運命 | SPN_UNM | 何かの大きな力に自分の運命は動かされているように感じることがある. | 1全くそう思わない-4非常にそう思う | | 自然感謝 | SPN_THK | 自然などの人間を超えた力に感謝の気持ちを持つことがある. | 1全くそう思わない-4非常にそう思う | | 自然恐怖 | SPN_FEA | 自然などの人間を超えた力に恐れの気持ちを持つことがある. | 1全くそう思わない-4非常にそう思う | | 自然生存 | SPN_LIV | 自然などの人間を超えた力によって,生かされていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 自然大切 | SPN_IMP | 自然は大切な存在である. | 1全くそう思わない-4非常にそう思う | | | | | | #### 監視 以下の質問について4点満点でお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------------- | -------------- | ------------------------------------------------------------ | --------------------------------- | | 第2者被監視感 | KAN_SEC | 日常生活の中で,直接誰か(人間)に見られていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 第3者被監視感 | KAN_THI | 日常生活の中で,監視カメラ等を通じて誰か(人間)に間接的に見られていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 超自然的被監視感 | KAN_SUP | 日常生活の中で,超自然的な存在に見られていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 第2者被監視感 | KAN_PRD | 無機物の中に,人間の表情のようなものを見出すことがある. | 1全くそう思わない-4非常にそう思う | | 自然大切 | KAN_KYK | 人に対して共感をすることがある. | 1全くそう思わない-4非常にそう思う | | | | | | #### 死後 以下の質問について4点満点でお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | -------- | -------------- | -------------------------------------- | --------------------------------- | | 死後世界 | DED_SHI | 「死後の世界」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 天国 | DED_TEN | 「天国」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 地獄 | DED_JIG | 「地獄」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 奇跡 | DED_KIS | 「奇跡」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 天罰 | DED_PUN | 「天罰」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | | | | | #### 性行動 以下の質問についてお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------- | ---------------------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | | 性衝動 | SEX_IMP,SEX_IMP_num(数値,欠損値有り) | あなたの性衝動はどの程度強いと思いますか?7点満点でお答え下さい.なお,答えたくない方は「8.答えたくない」を選んで下さい. | 全く弱い.2. 弱い.3. どちらかと言えば弱い.4. どちらとも言えない.5. どちらかと言えば強い.6. 強い.7. 非常に強い.8. 答えたくない. | | 自慰回数 | SEX_MAS,SEX_MAS_nen(年間回数): | あなたはどの程度の頻度でマスターベーションをしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. | 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」 | | 性交渉回数 | SEX_SEX,SEX_SEX_nen(年間回数) | あなたはどの程度の頻度で性交渉(性行為)をしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. | 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」 | | 性衝動対象 | SEX_OBJ | あなたの性衝動の対象として当てはまる選択肢を選んで下さい.なお,答えたくない方は「5.答えたくない」を選んで下さい. | 1.異性, 2. 同性,3. 両方,4. その他,5. 答えたくない | | 天罰 | SEX_NIN,SEX_NIN_cen(中央値) | あなたが性交渉(性行為)をしたことがある人数を教えて下さい.* 性交渉を(性行為)したことがない場合は「0. 0人」を選んで下さい. また,答えたくない方は「12.答えたくない」を選んで下さい. | 1. 0人 「0」, 2. 1人 「1」, 3. 2〜3人 「2.5」, 4. 4〜5人 「4.5」, 5. 5〜7人 「6」, 6. 8〜10人 「9」, 7. 11〜15人 「13」, 8. 16〜20人 「18」, 9. 21〜30人 「25.5」, 10. 31〜40人 「35.5」, 11. 41〜100人 「70.5」, 12. 101人以上 「101」, 13. 答えたくない.「NA」 | | 性情報開示 | SEX_NNA | 性情報に対して開示しなかった個数 | 上記5つについて答えたくないを選んだ個数 | | | | | | #### フェイスシート あなたのことについて教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | -------- | -------------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | | 性別 | F_SEX | あなたの性別を教えて下さい. | 1.男性, 2.女性,3.その他 | | 世代 | F_GEN | あなたの年齢を教えて下さい. | 1. 10代前半, 2. 10代後半, 3. 20代前半, 4. 20代後半, 5. 30代前半, 6. 30代後半, 7. 40代前半, 8. 40代後半, 9. 50代前半, 10. 50代前半, 11. 60代前半, 12. 60代後半, 13. 70代以降 | | 最終学歴 | F_FGR | あなたの最終学歴を教えて下さい. | 1. 中学校卒業, 2. 高校中退, 3. 高校卒業, 4. 専門学校(短期大学)中退, 5. 専門学校(短期大学)卒業, 6. 大学中退, 7. 大学卒業, 8. 大学院修士課程(博士前期課程)中退, 9. 大学院修士課程(博士前期課程)修了, 10. 大学院博士課程(博士後期課程)中退, 11. 大学院博士課程(博士後期課程)修了 | | 個人収入 | F_INK,F_INK_cen(中央値,百万円) | あなた個人の年収を教えて下さい. | 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない | | 世帯収入 | F_INS,F_INS_cen(中央値,百万円) | あなたの世帯での収入の合計を教えて下さい. | 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない | | 回答端末 | F_TAN | あなたが現在回答に使われているケータイ/タブレット/パソコンについて,当てはまるものを選んで下さい. | 1. パソコン(Windows), 2. パソコン(Mac), 3. パソコン(その他), 4. タブレット(Windows), 5. タブレット(iOS,iPad), 6. タブレット(android), 7. タブレット(その他), 8. スマホ(Windows), 9. スマホ(iOS,iPhone), 10. スマホ(android), 11. スマホ(その他), 12. ガラケー,フィーチャーホン, 13. その他 | | 都道府県 | PRE | あなたのお住まいの県を教えて下さい. | 1. 北海道2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県36. 徳島県37. 香川県38. 愛媛県39. 高知県40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県 | | 地域 | ARE | 都道府県から地域に変換 | 北海道:1. 北海道,東北地方:2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県,関東地方:8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県,中部地方:15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県,近畿地方:25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県,中国地方:31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県,四国地方:36. 徳島県37. 香川県38. 愛媛県39. 高知県,九州地方:40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県| | 未既婚 | MAR | あなたはご結婚されていますか? | NotMarried:未婚,Married:既婚 | | 子の有無 | CHI | あなたはお子さんがいらっしゃいますか? | NoChild:いない,Child:いる |